맨위로가기

조작적 조건화

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

조작적 조건화는 에드워드 손다이크의 효과의 법칙에서 시작되어, 행동의 결과에 따라 행동 빈도가 변화하는 학습 과정이다. B.F. 스키너는 조작적 조건화 연구를 통해 행동이 강화 또는 처벌에 의해 조절됨을 밝혀냈다. 강화는 행동 빈도를 증가시키고, 처벌은 감소시키며, 일차적 강화와 이차적 강화, 정적 및 부적 강화, 고정 및 변동 강화 스케줄 등 다양한 개념이 존재한다. 조작적 조건화는 중독, 동물 훈련, 응용 행동 분석, 아동 행동, 경제학, 도박, 군사 심리학, 넛지 이론, 칭찬, 비디오 게임, 방어적 의료 행위 등 다양한 분야에 응용된다.

더 읽어볼만한 페이지

  • 실험심리학 - 동기 부여
    동기는 목표 지향적 행동을 시작, 지속, 종료하게 하는 내적 상태 또는 힘으로, 방향, 강도, 지속성의 세 가지 주요 구성 요소로 분석되며, 다양한 유형과 이론으로 설명되고 교육, 직장 등 여러 분야에서 중요하게 다뤄진다.
  • 실험심리학 - 실험 심리학
    실험 심리학은 빌헬름 분트의 심리학 연구소 설립과 함께 시작되어, 다양한 연구 방법론을 활용하여 사고, 기억, 주의 등 심리 현상을 실험적으로 연구하며, 현재는 인지 심리학, 행동 심리학 등 여러 분야에서 활용되고 있다.
  • 심리적 조작 - 카리스마
    카리스마는 특정 개인의 비범한 능력이나 그에 대한 숭배를 의미하는 고대 그리스어에서 유래된 단어로, 막스 베버는 이를 사회학적 개념으로 정립하여 지배의 한 유형으로 제시했으며, 종교적, 정신의학적 용어로도 사용된다.
  • 심리적 조작 - 협박
    협박은 자신의 이익을 위해 타인에게 해악을 가할 것을 알려 공포심을 일으키는 행위로, 다양한 방식으로 나타나며 대한민국 형법상 협박죄로 처벌받고, 다른 범죄의 수단이 되거나 민사상 책임이 발생할 수 있다.
  • 행동주의 - 이반 파블로프
    이반 파블로프는 조건반사 연구로 유명한 러시아의 생리학자, 심리학자, 의사이며, 1904년 노벨 생리학·의학상을 수상했고, 개의 타액 분비 실험을 통해 고전적 조건화 개념을 정립했다.
  • 행동주의 - 행동 수정
    행동 수정은 학습 원리를 활용하여 부적절한 행동을 감소시키고 바람직한 행동을 증가시키는 심리 치료 기법으로, 고전적 조건화와 조작적 조건화에 기반하여 발전했으며 인지 행동 치료를 거쳐 개인의 경험과 가치에 대한 수용을 강조하는 3세대 행동 치료로 발전하여 다양한 정신 건강 문제와 행동 장애 치료에 활용된다.
조작적 조건화
조작적 조건화
개요
종류연합 학습 과정의 한 종류
목적행동 수정
역사
주요 인물버러스 프레더릭 스키너
기본 원리
강화행동을 증가시키는 과정
약화행동을 감소시키는 과정
정적 강화자극을 줌으로써 행동을 증가
부적 강화자극을 제거함으로써 행동을 증가
정적 약화자극을 줌으로써 행동을 감소
부적 약화자극을 제거함으로써 행동을 감소
도피싫어하는 자극을 피하는 행동
회피싫어하는 자극을 미리 막는 행동
관련 개념
소거강화가 없어질 때 행동이 줄어드는 것
영어
영어 명칭Operant conditioning
일본어
일본어 명칭オペラント条件づけ

2. 역사적 배경

조작적 조건화는 에드워드 손다이크의 결과의 법칙에서 유래했는데, 이 법칙은 행동이 만족스럽거나 불편한 결과로 인해 발생한다는 이론을 제시한다. 20세기에 조작적 조건화는 행동심리학자들에 의해 연구되었는데, 그들은 마음과 행동의 상당 부분이 환경적 조건화를 통해 설명된다고 믿었다. 강화는 행동을 증가시키는 환경 자극이고, 처벌은 행동을 감소시키는 자극이다. 두 종류의 자극 모두 긍정적 자극과 부정적 자극으로 더 세분화될 수 있는데, 각각 환경 자극의 추가 또는 제거를 포함한다.

조작적 조건화는 고전적 조건화와 다르다. 고전적 조건화는 자극이 생물학적으로 중요한 사건과 짝을 이루어 불수의적이고 반사적인 행동을 생성하는 과정이다. 반대로 조작적 조건화는 자발적이며 행동의 결과에 달려 있다.

20세기 동물 학습 연구는 이 두 가지 유형의 학습 분석이 지배했으며,[1] 여전히 행동 분석의 핵심이다. 또한 사회심리학 연구에도 적용되어 과대일치 효과와 같은 특정 현상을 명확히 하는 데 도움이 되었다.[2]

2. 1. 손다이크의 효과의 법칙

조작적 조건형성은 도구적 학습이라고도 불리는데, 에드워드 리 손다이크(1874~1949)가 직접 만든 퍼즐 상자에서 탈출하려는 고양이의 행동을 관찰하면서 처음으로 광범위하게 연구되었다.[3] 고양이는 끈을 당기거나 막대기를 미는 것과 같은 간단한 반응으로 상자에서 탈출할 수 있었지만, 처음에는 상당한 시간이 걸렸다. 반복적인 시도를 통해 비효율적인 반응은 덜 자주 발생하고 성공적인 반응은 더 자주 발생하여 고양이는 점점 더 빨리 탈출하게 되었다.[3]
1912년의 에드워드 리 손다이크
손다이크는 이러한 발견을 효과의 법칙으로 일반화했는데, 이 법칙은 만족스러운 결과를 따르는 행동은 반복되는 경향이 있고 불쾌한 결과를 초래하는 행동은 반복될 가능성이 적다는 것을 의미한다. 간단히 말해, 어떤 결과는 행동을 강화하고 어떤 결과는 행동을 약화시킨다. 손다이크는 탈출 시간을 시행 횟수에 따라 그래프로 나타냄으로써 이 절차를 통해 최초로 알려진 동물 학습 곡선을 만들었다.[4]

인간은 손다이크가 연구한 방식, 즉 조작적 조건형성을 통해 많은 단순한 행동을 학습하는 것으로 보인다. 즉, 반응이 성공적인 결과로 이어지면 유지되고 그렇지 않거나 불쾌한 효과를 초래하면 버려진다. 이것은 보통 어떤 "교사"에 의해 계획되지 않고 일어나지만, 조작적 조건형성은 부모들이 수천 년 동안 자녀를 가르치는 데 사용되어 왔다.[5]

2. 2. 스키너의 조작적 조건형성 연구

B.F. 스키너(1904~1990)는 조작적 조건형성의 아버지로 불리며, 그의 연구는 이 주제와 관련하여 자주 인용된다. 스키너는 1938년에 출간한 저서 "유기체의 행동: 실험적 분석"에서 조작적 조건형성 연구와 그것이 인간과 동물 행동에 적용되는 방식을 설명했다.[6] 스키너는 어니스트 마흐의 사상을 따라, 관찰 가능한 행동과 결과에 대한 분석을 구축했다.[7]

스키너는 고전적 조건형성이 인간 행동만큼 복잡한 것을 설명하기에는 너무 단순하다고 생각했다. 그는 의도적인 행동의 원인과 결과를 조사한 조작적 조건형성이 인간 행동을 더 잘 설명한다고 보았다.

하버드 심리학과의 B.F. 스키너, 1950년경


스키너는 경험적 접근을 위해 조작적 조건형성 상자(스키너 상자)를 발명했다. 이 상자는 비둘기나 쥐와 같은 피험자를 격리하고 통제된 자극에 노출시킬 수 있었다. 손다이크의 퍼즐 상자와 달리, 피험자는 한두 가지 간단하고 반복 가능한 반응을 할 수 있었고, 반응 비율이 주요 행동 측정이 되었다.[8] 스키너는 또한 누적 기록기를 발명하여 반응 속도의 그래픽 기록을 생성했다.[9]

이러한 기록은 스키너와 그의 동료들이 다양한 강화 일정의 반응 속도에 미치는 영향을 탐구하는 데 사용한 주요 데이터였다. 강화 일정은 "어떤 잘 정의된 규칙에 따라 유기체에 강화를 제공하는 모든 절차"로 정의될 수 있다.[10] 일정의 효과는 스키너가 조작적 조건형성에 대한 설명을 개발한 기본적인 발견이 되었다. 그는 또한 인간과 동물 행동에 대한 많은 덜 공식적인 관찰을 활용했다.[11]

스키너의 많은 저술은 조작적 조건형성을 인간 행동에 적용하는 데 할애되었다.[12] 1948년, 그는 조건형성 원칙을 중심으로 조직된 평화롭고 행복하며 생산적인 공동체에 대한 허구적인 이야기인 ''월든 투''를 출판했다.[13] 1957년에는 ''언어 행동''[14]을 출판하여 조작적 조건형성의 원리를 언어로 확장했다. 스키너는 언어의 몇 가지 본질을 포착하기 위해 "명령어"와 "접촉어"와 같은 새로운 기능적 관계를 정의했지만, 새로운 원칙을 도입하지 않고, 화자의 청중의 반응을 포함한 결과에 의해 통제되는 다른 어떤 행동과 마찬가지로 언어 행동을 다루었다.

조작적 조건 형성 실험을 위해 스키너는 조작적 조건 형성 상자(스키너 상자)를 발명했다. 스키너 상자 안에서 굶주린 쥐가 부저 소리가 날 때 레버를 누르면 먹이를 받도록 하면, 쥐는 곧 부저 소리에 반응하여 레버를 누르게 된다. 부저가 울린 직후 쥐가 레버를 누르는 빈도는 증가하는데, 이를 긍정적 강화라고 한다.

  • 이때 "레버 누르는 행동이 먹이로 강화된다"라고 표현한다.
  • 먹이는 나타난 것에 의해 직전의 조작적 행동의 자발적 빈도를 높였으므로 보상자극이라고 표현된다.
  • 굶긴 것이 먹이에 보상자극으로서의 특성을 부여했으므로, 굶김을 확립 조작이라고 한다.
  • 부저는 먹이에 선행하여 나타나기 때문에 선행 자극이라고 불린다.
  • 부저가 울리고 있을 때는 레버를 누르고, 울리지 않을 때는 누르지 않게 된 경우, 부저는 판별 자극이라고 불린다.

3. 조작적 행동의 기본 개념

조작적 조건화는 에드워드 손다이크의 결과의 법칙에서 유래했는데, 이 법칙은 행동이 만족스럽거나 불편한 결과로 인해 발생한다는 이론을 제시한다. 20세기에 조작적 조건화는 행동심리학자들에 의해 연구되었는데, 그들은 마음과 행동의 상당 부분이 환경적 조건화를 통해 설명된다고 믿었다.

조작적 조건화는 고전적 조건화와 다르다. 고전적 조건화는 자극이 생물학적으로 중요한 사건과 짝을 이루어 불수의적이고 반사적인 행동을 생성하는 과정이다. 반대로 조작적 조건화는 자발적이며 행동의 결과에 달려 있다.

20세기 동물 학습 연구는 이 두 가지 유형의 학습 분석이 지배했으며,[1] 여전히 행동 분석의 핵심이다. 또한 사회심리학 연구에도 적용되어 과대일치 효과와 같은 특정 현상을 명확히 하는 데 도움이 되었다.[2]

조작적 행동이란, 그 행동이 일어난 직후의 자극의 출현 또는 소멸과 같은 환경의 변화에 따라 빈도가 변하는 행동을 말한다. 조작적 조건형성은, 조작적 행동이 자발적으로 행동된 직후의 환경의 변화에 따라 그 후의 자발적 빈도가 변하는 학습을 말한다.

고전적 조건형성과는 달리, 조작적 행동에는 행동을 “유발하는” 선천적인 자극(무조건 유발 자극)은 존재하지 않는다. 조작적 행동에서는 생물이 자발적으로 행동한다.

또한, 조작적(operant)이란 오퍼레이트(작동하다 operate)에서 스키너(B.F. Skinner)가 만든 신조어이다.


  • 강화: 조작적 행동의 자발적 빈도 증가.
  • 처벌: 조작적 행동의 자발적 빈도 감소.
  • 보강제: 출현에 의해 직전 조작적 행동의 자발적 빈도를 높인 자극.
  • 처벌자: 출현에 의해 직전 조작적 행동의 자발적 빈도를 낮춘 자극.
  • 토큰: 화폐, 교환권, 점수 등 다른 보강제와 교환 가능한 보강제.

3. 1. 반응행동과 조작행동

고전적 조건화에서 사용된 반응과 같이 자극에 의해 직접적으로 유발되는 반응행동에는 침을 흘리는 행동, 동공 수축, 무릎 반사 등이 있다. 반면 조작행동은 특정 자극에 의해 일어나는 것이 아니라 스스로 일어나는 행동, 혹은 어떤 자극이 있었다고 하더라도 그것이 무엇인지 알 수 없는 경우의 행동을 말한다. 스키너는 외부 자극에 초점을 맞춘 고전적 조건화를 S형(Stimulus) 조건화라고 칭하면서, 조작에 관심을 가진 조작적 조건화를 R형(Response) 조건화라고 구분했다.[1]

조작행동은 유기체가 능동적으로 환경에 작용하는 행동을 의미한다. 조작행동으로 형성되는 조건을 조작적 조건화라고 하는데, 유기체가 행하는 조작행동은 결과에 따라 증가하거나 감소한다. 어떤 반응을 증가시키거나 감소시키는 것이 바로 조작적 조건화이다. 조작적 조건화는 에드워드 손다이크의 결과의 법칙에서 유래했는데, 이 법칙은 행동이 만족스럽거나 불편한 결과로 인해 발생한다는 이론을 제시했다. 조작적 행동은 '발현된다'고 하며, 처음에는 어떤 특정 자극에 의해서 유발되는 것이 아니다. 따라서, 애초에 왜 그러한 행동이 일어나는지 질문할 수 있는데, 이 질문에 대한 답은 다윈이 '새로운' 신체 구조의 기원에 대한 질문에 답한 것과 같이 변이와 선택이다. 마찬가지로, 개인의 행동은 특정 동작, 적용된 힘의 양 또는 반응의 시점과 같은 측면에서 순간순간 다릅니다. 강화로 이어지는 변이는 강화되고, 강화가 일관되면 행동은 안정적인 경향이 있다. 그러나 특정 변수를 조작함으로써 행동의 가변성 자체를 변경할 수 있다.[15] 조작적 행동이란, 그 행동이 일어난 직후의 자극의 출현 또는 소멸과 같은 환경의 변화에 따라 빈도가 변하는 행동을 말한다.

3. 2. 조작적 조건형성의 원리

에드워드 손다이크의 결과의 법칙에서 유래한 조작적 조건화는 유기체가 능동적으로 환경에 작용하는 조작행동과 그 결과에 따른 행동 변화를 설명한다. 스키너는 이를 'R형 조건화'라고 칭하며, 외부 자극에 초점을 맞춘 고전적 조건화(S형 조건화)와 구분했다.[1] 조작적 조건형성을 통해 어떤 반응을 증가시키거나 감소시키는 것이 가능하다.

조작적 조건화에서 행동 변화의 핵심 도구는 강화와 처벌이다.[16] "긍정적"과 "부정적"은 각각 자극의 추가 또는 제거를, "강화"와 "처벌"은 미래 행동 빈도의 증가 또는 감소를 의미한다.[16]

조작적 조건화에는 네 가지 결과가 있다.[16]

구분내용예시
긍정적 강화행동(반응)의 결과로 원하는 자극이 추가되어 미래에 그 행동의 빈도가 증가하는 경우[17]스키너 상자에 있는 쥐가 레버를 누르면 먹이를 얻는다면, 레버를 누르는 빈도가 증가할 것이다.
부정적 강화행동(반응)에 이어 불쾌한 자극이 제거되어 원래 행동의 빈도가 증가하는 경우어린아이가 불꽃놀이에서 큰 소리에 두려워한다. 아이는 헤드폰을 착용하고 더 이상 불꽃놀이 소리를 듣지 못한다. 다음에 아이가 불꽃놀이를 보면 헤드폰을 착용한다.
긍정적 처벌행동(반응)에 이어 불쾌한 자극이 주어져 미래에 그 행동이 발생할 가능성이 줄어드는 경우어린아이가 뜨거운 스토브에 손을 대고 화상을 입는다. 다음에 스토브를 보면 만지지 않는다.
부정적 처벌행동(반응)에 이어 자극이 제거되고 미래에 그 행동이 발생할 가능성이 줄어드는 경우직원이 점심을 공용 냉장고에 넣어두었는데, 휴식 시간 전에 도난당한다. 다음에 직원이 점심을 가져오면 냉장고에 넣지 않는다.


  • '''소거:''' 이전에 강화되었던 행동이 더 이상 긍정적 또는 부정적 강화로 강화되지 않는 경우 발생한다. 소거 동안 행동은 가능성이 줄어든다.[18]


조작적 행동은 행동 직후 자극의 출현 또는 소멸과 같은 환경 변화에 따라 빈도가 변하는 행동을 말하며, 조작적 조건형성은 이러한 변화에 따라 자발적 빈도가 변하는 학습을 의미한다.

스키너(B.F. Skinner)가 만든 신조어인 조작적(operant)은 오퍼레이트(작동하다 operate)에서 유래했다.

  • 강화: 조작적 행동의 자발적 빈도 증가.
  • 처벌: 조작적 행동의 자발적 빈도 감소.
  • 보강제: 출현에 의해 직전 조작적 행동의 자발적 빈도를 높인 자극.
  • 처벌자: 출현에 의해 직전 조작적 행동의 자발적 빈도를 낮춘 자극.
  • 토큰: 화폐, 교환권, 점수 등 다른 보강제와 교환 가능한 보강제.


'''행동 수반성'''(behavior contingency)은 행동의 자발적 빈도 변화와 그 행동 직후 환경 변화와의 관계를 말하며, 네 가지 종류가 있다.

종류내용
정적 강화긍정적 자극의 출현에 의한 강화
부적 약화긍정적 자극의 소멸에 의한 약화
정적 약화부정적 자극의 출현에 의한 약화
부적 강화부정적 자극의 소멸에 의한 강화



행동 수반성 관점을 통한 행동 분석은 행동 분석학의 근간이다.


  • 소거: 이전에 강화되었던 반응이 더 이상 유효하지 않을 때 발생.

3. 3. 스키너 상자

스키너 상자를 통해 조작적 조건형성이 실험되고 증명되었다. 스키너 상자는 빈 상자 안에 지렛대가 하나 들어 있으며, 이 지렛대는 먹이통과 연결되어 있어 지렛대를 누르면 먹이가 나오도록 되어 있다. 조작적 조건형성 실험 과정은 다음과 같다.

# 배고픈 상태의 흰 쥐를 스키너 상자에 넣는다.

# 이렇게 배고픈 상태로 만드는 것을 '''박탈'''이라고 한다.

# 흰 쥐는 스키너 상자 안에서 돌아다니다가 ''우연히 지렛대를 누르게 된다''.

# 지렛대를 누르자 ''먹이가 나온다''.

# 지렛대와 먹이 간의 상관관계를 알지 못하는 쥐는 다시 상자 안을 돌아다닌다.

# 다시 우연히 지렛대를 누른 흰 쥐는 또 먹이가 나오는 것을 보고 ''지렛대를 누르는 행동을 자주 하게 된다''.

# 이러한 과정이 반복되면서 흰 쥐는 지렛대를 누르면 먹이가 나온다는 사실을 학습하게 된다.

위의 실험에서 흰 쥐가 지렛대를 누르는 행동은 먹이에 의해 강화된 것이다. 만약 지렛대를 눌렀을 때 먹이가 나오지 않았다면 지렛대를 누르는 행동을 학습하지 못했을 것이다. 이렇게 어떤 행동을 한 뒤에 유기체가 원하는 것을 제공하는 것을 '''강화'''(Reinforcement)라고 한다. 고전적 조건화에서는 강화를 조건화 과정에서 무조건자극(UnConditioned Stimulus)을 부여하는 것으로 명명했지만, 조작적 조건화에서는 조건화 과정에서 부여하는 보상을 의미하는 것으로 사용한다. 조작적 조건화가 이루어지기 위해서는 강화가 중요한 역할을 한다.

스키너는 조작적 조건 형성 실험을 위해 '''조작적 조건 형성 상자'''(Operant conditioning chamber)를 발명했다. 이것은 현재 '''스키너 상자'''라고 불린다.

스키너 상자에 굶긴 쥐를 넣고, 부저가 울릴 때 레버를 누르면 먹이를 주도록 하면, 곧 쥐는 부저 소리에 반응하여 레버를 누르게 되고, 부저가 울린 직후 쥐가 레버를 누르는 빈도(확률)가 증가한다. 이것이 '''긍정적 강화'''의 한 예이다.

  • 이때 「레버 누르는 행동이 먹이로 '''강화'''된다」라고 표현된다.
  • 먹이는 나타난 것에 의해 직전의 조작적 행동의 자발적 빈도를 높였으므로 '''보상자극'''이라고 표현된다.
  • 굶긴 것이 먹이에 보상자극으로서의 특성을 부여(확립)했으므로, 굶김을 '''확립 조작'''이라고 한다.
  • 부저는 먹이에 선행하여 나타나기 때문에 '''선행 자극'''이라고 불린다.
  • 부저가 울리고 있을 때는 레버를 누르고, 울리지 않을 때는 누르지 않게 된 경우, 부저는 '''판별 자극'''이라고 불린다.

4. 강화 이론

스키너는 유기체가 어떤 행동을 한 결과가 스스로에게 유리하면 그 행동을 더 자주 하게 된다고 보았다(1953). 강화와 처벌은 조작적 조건 형성에서 행동을 변화시키는 핵심 도구이다. 강화는 미래에 행동이 더 자주 발생하도록 만드는 결과를 의미하는 반면, 처벌은 행동이 더 적게 발생하도록 만드는 결과를 의미한다.[16]

강화와 처벌의 효과는 다음과 같은 요인에 의해 달라질 수 있다.


  • 포만/결핍: 긍정적 자극의 효과는 개인이 욕구를 충족할 만큼 충분한 자극을 받으면 감소하고, 반대로 자극을 박탈당하면 효과가 증가한다. 배부른 사람은 배고픈 사람만큼 동기가 부여되지 않는다.[20]
  • 즉시성: 즉각적인 결과는 지연된 결과보다 더 효과적이다. 개에게 5초 이내에 앉는 행동에 대해 간식을 주면, 30초 후에 줄 때보다 더 빨리 학습한다.[21]
  • 우연성: 강화는 반응 후에 일관되게 발생해야 효과적이다. 간헐적 강화는 학습을 느리게 할 수 있지만, 소멸 속도는 느리다.[1]
  • 크기: 자극의 크기는 강화제의 잠재력에 영향을 미친다. 인간과 동물은 비용-편익 분석을 한다. 레버를 눌러 사료 10개를 얻는다면, 1개만 얻을 때보다 더 빠르게 학습한다.[1]


이러한 요인의 대부분은 생물학적 기능을 수행한다. 예를 들어, 포만 과정은 유기체가 안정적인 내부 환경(항상성)을 유지하는 데 도움을 준다. 유기체가 설탕을 박탈당하면 설탕 맛은 효과적인 강화제가 되지만, 혈당이 최적 수준에 도달하면 설탕 맛은 효과가 떨어지거나 역겨워진다.

'''행동 수반성'''(behavior contingency)은 행동의 자발적 빈도 변화와 그 행동 직후 환경 변화와의 관계를 말하며, 행동 분석학의 근간이다. 행동 수반성에는 네 가지 종류가 있다.

  • 정적 강화: 긍정적 자극의 출현에 의한 강화
  • 부적 약화: 긍정적 자극의 소멸에 의한 약화
  • 정적 약화: 부정적 자극의 출현에 의한 약화
  • 부적 강화: 부정적 자극의 소멸에 의한 강화

4. 1. 강화인

스키너는 유기체가 어떤 행동을 한 결과가 스스로에게 유리하면 그 행동을 더 자주 하게 된다고 보았다(1953). 이때 그 행동의 결과로 주어진 것으로 행동의 빈도를 높이는 자극을 '''강화인'''(Reinforcer)이라고 하는데(Chance,1999), 이런 강화인은 일차적 강화인과 이차적 강화인으로 나누어 볼 수 있다.[16]

먼저 '''일차적 강화인'''(Primary Reinforcer)은 유기체의 행동을 직접적으로 증가시킬 수 있는 강화인이다. 예를 들면 음식이나 물과 같은 것이 되겠는데, 당장 배고픈 유기체에게 음식으로 만족을 주는 것으로써 바로 다음 행동을 증가시킬 수 있다. 반면에 '''이차적 강화인'''(Secondary Reinforcer)은 유기체의 행동을 바로 증가시키지 못한다. 하지만 일차적 강화인과 연합하여 행동을 증가시킬 수 있는데, 쿠폰, 토큰 등이 이에 해당한다. 즉, 쿠폰이나 토큰으로도 유기체를 강화할 수 있지만 그것은 유기체를 직접 강화하는 것이 아니라 일차적 강화인과 교환할 수 있기 때문에 강화가 가능하다는 것이다.

이차적 강화인으로써 가장 대표적인 것이 이다. 돈은 여러 종류의 일차적 강화인과 교환할 수 있기 때문에 '''일반화된 강화인'''이라고 부르기도 한다.

4. 2. 정적 강화와 부적 강화

강화는 어떤 행동을 한 뒤에 유기체가 원하는 자극을 제공하여 행동의 빈도수를 높이는 것을 말한다. 선호 자극을 제공하는 것뿐만 아니라 혐오 자극을 제거하는 것으로도 유기체를 강화시킬 수 있다. 선호 자극의 제공으로 행동의 빈도수를 높이는 강화를 정적 강화라고 하고, 혐오 자극의 제거로 행동의 빈도수를 높이는 강화를 부적 강화라고 한다.

'''정적 강화'''(Positive Reinforcement)는 선호 자극을 제공하여 유기체를 강화시킨다. 예를 들어, 교사가 학생들의 발표를 유도하기 위해 발표를 할 때마다 추가 점수를 주거나 사탕을 주는 것은 정적 강화에 해당한다. 여기서는 발표라는 행동의 빈도수를 높이기 위해 추가 점수나 사탕이라는 선호 자극을 제공함으로써 학생을 강화시킨 것이다.[17]

반면에 '''부적 강화'''(Negative Reinforcement)는 혐오 자극을 제거하여 유기체를 강화시키는 것을 말한다. 부적 강화도 정적 강화처럼 결과적으로 유기체가 유리하다고 느끼게 하지만, 선호 자극을 제공하지 않고 혐오 자극을 제거한다는 점에서 차이가 있다. 예를 들어, 화장실 청소를 해야 하는 아이에게 '오늘 수업에 열심히 참여하면 화장실 청소를 하지 않아도 좋다'라고 말하여 아이가 수업에 열심히 참여하였다면, 화장실 청소라는 혐오 자극을 제거함으로써 수업에 열심히 참여하는 행동을 증가시킨 것이다.

스키너 상자 실험에서 쥐가 레버를 누르면 먹이를 얻는다면 레버를 누르는 빈도가 증가하는 것은 정적 강화의 예시이다. 반면 어린아이가 불꽃놀이에서 큰 소리에 두려워 헤드폰을 착용하고 불꽃놀이 소리를 듣지 않게 된다면, 다음에 불꽃놀이를 볼 때 헤드폰을 착용하는 행동은 부적 강화의 예시가 된다.[16]

4. 3. 강화 스케줄

강화 스케줄은 강화 전달을 통제하는 규칙이다. 이 규칙은 강화가 제공될 시간, 수행되어야 할 반응의 수, 또는 둘 다를 지정한다.[19][9] 여러 가지 규칙이 있을 수 있지만, 가장 기본적이고 일반적으로 사용되는 규칙은 다음과 같다.

  • 계속적 강화(연속 강화): 바람직한 행동이 나타날 때마다 지속적으로 강화한다.
  • 간헐적 강화(부분 강화): 바람직한 행동이 나타났을 때 주기적 또는 평균적으로 강화한다. 간헐적 강화에는 시간 간격에 따라 강화하는 간격(interval) 강화와 반응 횟수에 따라 강화하는 비율(ratio) 강화가 있다. 간격 강화와 비율 강화 각각에는 고정적(fixed) 강화와 변동적(variable) 강화가 있다.
  • 고정 간격 강화 스케줄(FI): 이전 강화 이후 고정된 시간이 경과한 후 첫 번째 반응이 있을 때 강화가 발생한다. 이 스케줄은 "휴지-작동" 반응 패턴을 생성한다. 즉, 훈련 후 유기체는 일반적으로 강화 후 일시 정지한 다음, 다음 강화 시간이 다가옴에 따라 빠르게 반응하기 시작한다.
  • 변동 간격 강화 스케줄(VI): 이전 강화 이후 변동하는 시간이 경과한 후 첫 번째 반응이 있을 때 강화가 발생한다. 이 스케줄은 일반적으로 강화 사이의 평균 시간에 따라 변하는 비교적 안정적인 반응률을 생성한다.
  • 고정 비율 강화 스케줄(FR): 이전 강화 이후 특정 수의 반응이 발생한 후에 강화가 발생한다. 훈련을 받은 유기체는 일반적으로 강화 후 잠시 휴지한 다음 높은 비율로 반응한다. 반응 요구량이 낮으면 휴지가 없을 수도 있고, 반응 요구량이 높으면 유기체가 반응을 완전히 중단할 수도 있다.
  • 변동 비율 강화 스케줄(VR): 이전 강화 이후 변동하는 수의 반응이 발생한 후에 강화가 발생한다. 이 스케줄은 일반적으로 매우 높고 지속적인 반응률을 생성한다.


조작적 축적(Operant hoarding)은 특정 방식으로 강화된 쥐가 먹이 알갱이를 가져가는 대신 먹이 상자에 먹이 알갱이가 쌓이도록 내버려두는 현상이다. 이 절차에서 먹이 알갱이를 가져오는 행위는 항상 1분간의 소거 기간을 시작하게 되는데, 이 기간 동안에는 추가적인 먹이 알갱이가 제공되지 않지만 이전에 축적된 먹이 알갱이는 먹을 수 있다. 이러한 발견은 쥐가 작은 먹이를 즉시 얻는 것과 더 큰 먹이를 약간 지연 후에 얻는 것 사이에서 선택해야 하는 상황에서 충동적으로 행동한다는 일반적인 발견과 모순되는 것처럼 보인다. [25]

5. 처벌 이론

조작적 조건화에서는 특정 행동의 빈도를 감소시키기 위해 혐오 자극을 제공하거나 선호 자극을 제거하는 방법을 사용한다. 이를 통해 행동 빈도수를 줄일 수 있으며, 행동 빈도를 증가시키는 강화와 대비되는 개념으로 약화(벌)가 있다.

강화와 처벌은 조작적 조건 형성에서 행동 변화를 위한 핵심 도구이다. 여기서 '긍정적'과 '부정적'은 자극의 추가 또는 제거 여부를 나타내며, '강화'와 '처벌'은 미래 행동 빈도의 변화를 의미한다. 즉, 강화는 행동 빈도를 증가시키는 결과를, 처벌은 행동 빈도를 감소시키는 결과를 뜻한다.[16]

5. 1. 정적 처벌과 부적 처벌

벌은 유기체의 행동 결과로 선호 자극을 제거하거나 혐오 자극을 제공하는 것을 의미한다. 혐오 자극을 제공하는 것을 '''수여성 벌'''이라고 하며, 체벌이 대표적인 예시이다. 학생이 바람직하지 못한 행동을 했을 때 교사가 체벌을 가하여 그 행동을 더 이상 하지 않게 만드는 것이다.[82][83]

반면, 선호 자극을 제거하는 벌은 '''박탈성 벌'''이라고 한다. 박탈성 벌은 그동안 받아오던 강화인을 제거하는 것과 같다. '타임아웃'이 대표적인 예시인데, 어떤 학생이 교실을 시끄럽게 하는 경우, 그 학생을 일시적으로 교실 밖으로 내보내는 것이다. 이는 편하게 교실에서 공부할 기회와 친구들과 함께 있을 기회를 박탈하는 것으로, 직접적인 혐오 자극을 주는 것이 아니라 선호 자극을 제거하는 박탈성 벌에 해당한다.[82][83]

항목정적(적극적)부적(소극적)
강화이익 제공불이익 회수
약화(처벌)불이익 제공이익 회수

[82][83]

'''정적 처벌'''(조건부 자극에 의한 처벌)은 행동에 이어 불쾌한 자극이 주어져 미래에 그 행동이 발생할 가능성이 줄어드는 경우이다. 예를 들어, 어린아이가 뜨거운 스토브에 손을 대고 화상을 입으면, 다음에 스토브를 보면 만지지 않게 된다. 이는 스토브를 만진 것이 정적 처벌된 것이다.[16]

'''부적 처벌'''(벌칙)(조건부 제거에 의한 처벌)은 행동에 이어 자극이 제거되고 미래에 그 행동이 발생할 가능성이 줄어드는 경우이다. 예를 들어, 직원이 점심을 공용 냉장고에 넣어두었는데, 휴식 시간 전에 도난당하면, 다음에 직원이 점심을 가져올 때 냉장고에 넣지 않게 된다. 이는 점심을 냉장고에 넣는 것이 부정적으로 처벌된 것이다.[16]

5. 2. 처벌 적용 시 주의사항

처벌은 유기체가 바람직하지 않다고 생각하는 행동을 했음에도 처벌을 받지 않으면, 그 행동이 잘못된 것이 아닐 수 있다고 믿게 만드는 부작용을 일으킬 수 있다.[84] 대표적인 부작용으로는 처벌받은 유기체가 다른 유기체에게 공격적인 행동을 자주 보이거나,[84] 부정적인 정서 반응, 거짓말, 변명 등의 회피 반응을 보이는 것이 있다.[85]

불가피하게 처벌을 해야 한다면, 처벌의 강도는 강할수록, 즉각적으로 제공할수록 바람직하지 못한 행동을 더 분명하게 인식하게 할 수 있다.[86][87][88][89] 그러나 처벌이 없어지면 부적 강화로 여겨질 수 있으므로, 문제 행동이 일어날 때마다 처벌을 제공해야 하는 문제점이 발생한다.[86][87][88][89] 또한, 행동과 처벌 사이에 객관적이고 합리적인 타당성이 있어야 한다.[86][87][88][89] 따라서 대부분의 심리학자들은 바람직하지 못한 행동에 대해 처벌을 하기보다는, 처벌을 하더라도 대안적인 행동을 확실히 제시하고 선택의 필요성을 중립적으로 제안해야 한다고 말한다.

처벌은 문제 행동과 처벌 제공자와의 관계에서 '관심'이라는 자극과 반응을 강화시킬 수 있다는 점에서 왜곡될 경우 부정적인 영향을 줄 수 있다. 따라서 처벌과 보상을 함께 사용하는 것이 처벌만 사용하는 것보다 효과적일 수 있다.

6. 조작적 행동의 수정

조작적 행동은 다양한 방식으로 변화될 수 있다.

회피 학습에서 유기체는 혐오스러운 자극을 피하거나 종료하는 행동을 학습한다. 예를 들어, 햇빛으로부터 눈을 가리는 행동은 밝은 빛이라는 혐오적 자극을 없애는 음성 강화의 예시이다. 외출 전 선글라스를 착용하는 것은 자극을 미리 피하는 회피 행동이다. 이러한 회피 행동은 "회피 역설", 즉 자극이 없는데 어떻게 강화가 되는가 하는 문제를 야기한다.[24]

회피 학습에는 두 가지 실험 설정이 사용된다.

실험 종류설명
판별 회피 학습중성 자극(예: 빛) 후 불쾌 자극(예: 전기 충격)이 따르는 시행을 반복한다. 조작적 반응(예: 레버 누르기)으로 불쾌 자극을 막거나 끝낼 수 있다. 처음에는 불쾌 자극이 시작된 후 반응하는 "탈출" 시행을 보이지만, 학습 후에는 중성 자극에 반응하여 불쾌 자극을 피하는 "회피" 시행을 보인다. 고전적 조건화가 포함된다.[24]
자유 조작 회피 학습조작적 반응이 없으면 주기적으로 불쾌 자극(예: 전기 충격)이 주어진다. 반응은 충격 시작을 늦춘다. S-S 간격(반응 없을 때 충격 간 시간)과 R-S 간격(반응 후 충격 지연 시간)이 학습률을 결정한다. 반응할 때마다 충격 없는 R-S 간격이 새로 시작된다.[24]



회피 학습 이론에는 다음이 포함된다.


  • 이중 요인 이론: 차별적 회피 학습을 설명하기 위해 제안되었다. 불쾌 자극 신호에서 벗어나는 과정을 다룬다. 고전적 조건화(신호에 대한 공포)와 조작적 조건화(탈출 반응 강화)의 두 과정으로 구성된다.[24]
  • 공포의 고전적 조건화: 조건 자극(CS)과 무조건 자극(US)의 짝짓기로 CS와 US가 연합된다. US의 불쾌함 때문에 CS는 "공포"라는 조건화된 정서 반응을 일으킨다.
  • 공포 감소에 의한 조작적 반응 강화: CS는 공포를 신호하고, 이 불쾌한 반응은 조작적 반응을 유발한다. CS를 종료하는 반응은 공포 감소로 강화된다. 유기체는 US를 피하는 것이 아니라 CS로 인한 불쾌한 내적 상태에서 벗어난다.[24]
  • 단일 요인 이론(인지 이론): 회피 행동은 결과에 의해 유지되는 조작 행동의 특수한 경우이다. "결과"는 사건 패턴에 대한 민감성을 포함한다. 회피에서 반응 결과는 불쾌 자극 비율 감소이다. "놓친 충격"이 자극 및 강화제로 작용할 수 있다. 인지 이론에서는 쥐가 레버를 누르지 않으면 충격을, 누르면 충격 없음을 예상하고, 이 기대가 확인되면 회피 행동이 강화된다고 본다.[24]


조작적 축적은 특정 방식으로 강화된 쥐가 먹이를 바로 가져가지 않고 쌓아두는 현상이다. 먹이를 가져가면 1분간 소거 기간이 시작되어 추가 먹이는 없지만, 쌓인 먹이는 먹을 수 있다. 이는 즉각적인 작은 보상보다 지연된 큰 보상을 선택하는 상황에서 충동적 행동을 보이는 일반적 발견과 모순된다.[25]

6. 1. 소거

소거는 이전에 강화되었던 행동이 더 이상 긍정적 또는 부정적 강화로 강화되지 않을 때 발생하는 결과 전략이다. 소거 과정에서 행동의 발생 가능성은 줄어든다. 때때로 강화는, 반복되는 사례가 강화를 얻는 데 필요하게 되는 학습 요인으로 인해, 소거 전에 각 기회마다 강화가 주어지는 것과 비교하여 행동 소거 전에 더 긴 지연으로 이어질 수 있다.[18]

6. 2. 셰이핑

셰이핑은 동물 훈련이나 비언어적 의사소통이 어려운 사람들을 가르칠 때 자주 사용되는 조건화 방법이다. 훈련자는 먼저 원하는 최종 행동, 즉 '목표 행동'을 정한다. 그런 다음 훈련자는 동물이 이미 어느 정도 보이고 있는 행동을 선택하여, 목표 행동에 점점 더 가까워지도록 행동의 형태를 점진적으로 변화시킨다. 최종적으로 목표 행동이 나타나면, 이를 강화하고 유지할 수 있다.[24]

6. 3. 비결합 강화

비결합 강화는 유기체의 행동과 상관없이 강화 자극을 제공하는 것을 말한다. 비결합 강화는 목표 반응을 소거하는 동안 여러 대안 반응을 강화함으로써 원치 않는 목표 행동을 줄이기 위해 사용될 수 있다.[22] 측정된 행동이 강화되었다고 확인되지 않기 때문에, 비결합 "강화"라는 용어의 사용에 대한 논란이 있다.[23]

6. 4. 자극 통제

조작적 행동은 처음에는 특정 자극과 관련 없이 나타나지만, 조작적 조건화 과정에서 행동이 강화될 때 존재하는 자극의 통제를 받게 된다. 이러한 자극을 "판별 자극"이라고 한다. 그 결과, 판별 자극은 보상이나 처벌을 유발하는 반응의 조건을 형성하는 삼항구조(three-term contingency)가 나타난다.

'''행동 수반성'''은 조작적 조건화에서 행동의 자발적 빈도 변화와 그 행동 직후 환경 변화 사이의 관계를 의미하며, 다음과 같은 네 가지 종류가 있다.

  • 정적 강화: 긍정적 자극의 출현에 의한 강화
  • 부적 약화: 긍정적 자극의 소멸에 의한 약화
  • 정적 약화: 부정적 자극의 출현에 의한 약화
  • 부적 강화: 부정적 자극의 소멸에 의한 강화


행동 수반성의 관점에서 행동을 분석하는 것은 행동 분석학의 기초가 된다.

소거는 이전에 강화되었던 반응이 더 이상 효과가 없을 때 발생한다.

6. 4. 1. 판별, 일반화, 맥락

조작적 행동은 처음에는 특정 자극에 대한 구별 없이 나타나지만, 조작적 조건화 과정에서 행동이 강화될 때 존재하는 자극의 통제를 받게 된다. 이러한 자극을 "판별 자극"이라고 한다. 그 결과, 판별 자극은 보상이나 처벌을 생성하는 반응의 경우를 설정하는 삼항구조(three-term contingency)가 나타난다. 예를 들어, 쥐는 불이 켜질 때만 레버를 누르도록 훈련받을 수 있고, 개는 자신의 사료 주머니 소리를 들으면 부엌으로 달려가며, 아이는 테이블 위 사탕을 보면 손을 뻗는다.

대부분의 행동은 자극 통제를 받으며, 다음과 같은 측면으로 구분할 수 있다.

  • '''판별'''은 특정 자극이 있는 경우에만 반응이 강화될 때 발생한다. 예를 들어, 비둘기가 빨간 불을 쪼면 먹이를 받고 녹색 불을 쪼면 먹이를 받지 못하면, 빨간색을 쪼고 녹색을 쪼는 것을 멈춘다. 자극과 다른 조건의 복잡한 조합도 연구되었는데, 예를 들어 유기체는 한 자극에서는 간격 일정으로, 다른 자극에서는 비율 일정으로 강화될 수 있다.

  • '''일반화'''는 이전에 훈련된 판별 자극과 유사한 자극에 반응하는 경향이다. 예를 들어, "빨간색"을 쪼도록 훈련받은 비둘기는 "분홍색"도 쪼을 수 있지만, 덜 강하게 쪼는 경향을 보인다.

  • '''맥락'''은 방의 벽, 테이블, 의자 등 또는 조작적 조건 형성 상자의 내부와 같이 상황에서 지속적으로 존재하는 자극을 의미한다. 맥락 자극은 일반적으로 약하지만, 판별 자극처럼 행동을 통제할 수 있다. 한 맥락에서 학습된 행동은 다른 맥락에서는 나타나지 않거나 변경될 수 있으며, 이는 치료 환경에서 학습된 행동이 다른 상황에서 발생하지 않아 행동 치료에 어려움을 줄 수 있다.

6. 5. 행동 연쇄

대부분의 행동은 개별 반응을 하나씩 강화하는 것만으로는 설명하기 어렵다. 조작적 조건 형성 분석은 행동 연쇄 개념을 통해 확장된다. 행동 연쇄는 3요소 조건[1]에 의해 서로 연결된 일련의 반응이다. 사슬 형성은 차별적 자극[2]이 후속 행동의 기회를 제공할 뿐만 아니라, 그 이전 행동을 강화할 수 있다는 실험적으로 증명된 사실에 기반한다. 즉, 차별적 자극은 "조건화된 강화자"이기도 하다. 예를 들어, 레버 누르기 기회를 제공하는 불빛은 소음이 있는 상황에서 "몸을 돌리는" 행동을 강화하는 데 사용될 수 있다. 이는 "소음 – 몸 돌리기 – 불빛 – 레버 누르기 – 먹이" 순서로 이어진다. 더 많은 자극과 반응을 추가하여 훨씬 더 긴 사슬을 만들 수 있다.

6. 6. 회피와 탈출

회피 학습에서 어떤 행동은 햇빛으로부터 눈을 가리는 것처럼 혐오적인 자극을 종료시킨다. 외출하기 전에 선글라스를 착용하는 것처럼, 자극을 예방함으로써 유지되는 행동을 "회피"라고 한다. 회피 행동은 자극의 비발생이 어떻게 강화제 역할을 할 수 있는지에 대한 "회피 역설" 문제를 제기한다.[24]

일반적으로 사용되는 두 가지 종류의 실험적 설정은 다음과 같다.

실험 종류설명
판별 회피 학습일련의 시행으로 구성되며, 빛과 같은 중성 자극 후 전기 충격과 같은 불쾌 자극이 뒤따른다. 중성 자극이 나타난 후 레버 누르기와 같은 조작적 반응이 불쾌 자극을 방지하거나 종결시킨다. 초기 시행에서는 피험자가 불쾌 자극이 시작될 때까지 반응하지 않아 "탈출" 시행이라고 한다. 학습이 진행되면 피험자는 중성 자극 동안 반응하여 불쾌 자극 발생을 방지하는 "회피" 시행을 보인다. 이 실험은 고전적 조건화를 포함한다.[24]
자유 조작 회피 학습피험자는 조작적 반응을 하지 않으면 주기적으로 전기 충격과 같은 불쾌 자극을 받는다. 반응은 충격 시작을 지연시킨다. 차별적 회피와 달리, 사전 자극이 충격을 알리지 않는다. S-S(충격-충격) 간격(반응 없는 상태에서 연속적인 충격 사이의 시간)과 R-S(반응-충격) 간격(조작적 반응이 다음 충격 시작을 지연시키는 시간)이 회피 학습률을 결정한다. 피험자가 조작적 반응을 할 때마다 충격이 없는 R-S 간격이 새롭게 시작된다.[24]



회피 학습에 대한 이론은 다음과 같다.


  • 이중 요인 이론: 차별적 회피 학습을 설명하기 위해 제안되었다. 유기체가 불쾌 자극의 신호로부터 벗어남으로써 불쾌 자극을 회피하는 과정을 설명한다. 이 이론은 두 가지 과정, 즉 신호에 대한 고전적 조건화와 탈출 반응에 대한 조작적 조건화를 포함한다.
  • 공포의 고전적 조건화: CS(조건 자극)와 US(무조건 자극)의 짝짓기를 통해 CS와 US 사이의 연합이 만들어진다. US의 불쾌한 성질 때문에 CS는 조건화된 정서 반응, 즉 "공포"를 유발한다.
  • 공포 감소에 의한 조작적 반응의 강화: CS는 공포를 신호하고, 이 불쾌한 정서 반응은 조작적 반응을 유발한다. CS를 종결시키는 반응은 공포 종결에 의해 강화된다. 유기체는 US를 예상하여 "회피"하는 것이 아니라, CS에 의해 야기되는 불쾌한 내적 상태로부터 "탈출"한다.[24]
  • 단일 요인 이론: 회피 행동이 단순히 그 결과에 의해 유지되는 조작 행동의 특수한 경우라고 제안한다. "결과" 개념은 사건 패턴에 대한 민감성을 포함하도록 확장된다. 회피에서 반응의 결과는 불쾌한 자극 비율의 감소이다. "놓친 충격"이 자극으로 감지되고 강화제 역할을 할 수 있다는 실험적 증거가 있다. 인지 이론은 쥐가 레버를 누르지 않으면 "충격을 예상"하고 누르면 "충격을 예상하지 않게" 되며, 이러한 기대가 확인되면 회피 행동이 강화된다고 본다.[24]

6. 7. 조작적 축적

조작적 축적은 특정 방식으로 강화된 쥐가 먹이 알갱이를 가져가는 대신 먹이 상자에 먹이 알갱이가 쌓이도록 내버려두는 현상을 말한다. 이 절차에서 먹이 알갱이를 가져오는 행위는 항상 1분간의 소거 기간을 시작하게 되는데, 이 기간 동안에는 추가적인 먹이 알갱이가 제공되지 않지만 이전에 축적된 먹이 알갱이는 먹을 수 있다. 이러한 발견은 쥐가 작은 먹이를 즉시 얻는 것과 더 큰 먹이를 약간 지연 후에 얻는 것 사이에서 선택해야 하는 상황에서 충동적으로 행동한다는 일반적인 발견과 모순되는 것처럼 보인다. 강화 스케줄 참조.[25]

7. 신경생물학적 상관관계

말론 들롱(Mahlon DeLong)[26]과 R.T. 리처드슨(R.T. Richardson)[27]의 연구는 조건화된 자극을 암호화하는 것으로 보이는 반응을 보이는 뉴런을 처음으로 확인한 과학적 연구이다. 이들은 전뇌 피질 전체에 걸쳐 아세틸콜린을 광범위하게 방출하는 기저핵 뉴런이 조건화된 자극 직후 또는 조건화된 자극이 없는 경우 1차 보상 후 곧 활성화된다는 것을 보였다. 이 뉴런들은 긍정적 강화제와 부정적 강화제에 대해 동일하게 활성화되며, 많은 대뇌피질 영역에서 신경가소성과 관련이 있는 것으로 나타났다.[28] 도파민이 비슷한 시기에 활성화된다는 증거도 있다.[29] 도파민이 강화 학습과 혐오 학습 모두에 관여한다는 상당한 증거가 있다.[30] 도파민 경로는 전전두엽 피질 영역에 훨씬 더 조밀하게 투사된다. 반대로 콜린성 투사는 일차 시각 피질과 같은 후방 피질 영역에서도 조밀하다. 도파민의 작용 부족으로 인한 질환인 파킨슨병 환자에 대한 연구는 긍정적 강화에서 도파민의 역할을 더욱 잘 보여준다.[31] 이 연구는 약물을 복용하지 않은 환자들이 긍정적 강화보다 혐오적 결과를 통해 더 쉽게 학습한다는 것을 보였다. 약물을 복용한 환자들은 그 반대의 결과를 보였는데, 도파민 활동이 높을 때 긍정적 강화가 더 효과적인 학습 형태임을 증명했다.

도파민을 포함하는 신경화학적 과정이 강화의 기저가 된다는 것이 제시되었다. 유기체가 강화 자극을 경험하면 뇌의 도파민 경로가 활성화된다. 이 경로 네트워크는 "많은 수상돌기에 도파민의 짧은 펄스를 방출하여 시냅스후 뉴런에 전반적인 강화 신호를 방송한다."[32] 이를 통해 최근에 활성화된 시냅스가 원심성(밖으로 전도하는) 신호에 대한 감도를 높여 강화에 앞서 일어난 최근 반응의 발생 확률을 높일 수 있다. 이러한 반응은 통계적으로 강화를 성공적으로 달성하는 데 책임이 있는 행동일 가능성이 가장 높다. 그러나 강화의 적용이 덜 즉각적이거나 덜 우연적(덜 일관성 있음)인 경우, 도파민이 적절한 시냅스에 작용하는 능력이 감소한다.

8. 효과의 법칙에 대한 의문점

위에서 정의된 강화 없이도 조작적 행동이 확립될 수 있음을 보여주는 몇 가지 관찰 결과가 있다. 가장 많이 인용되는 것은 자가 형성(autoshaping) 현상(때로는 "징후 추적"이라고도 함)으로, 자극이 반복적으로 강화를 수반하고 그 결과 동물이 자극에 반응하기 시작하는 현상이다.[33][34] 예를 들어, 반응 키에 불이 켜진 다음 음식이 제공된다. 이것이 몇 번 반복되면 비둘기는 새가 쪼아먹든 안 쪼아먹든 음식이 나오는데도 키를 쪼아먹기 시작한다. 마찬가지로 쥐는 음식이 근처에 제공될 때 레버와 같은 작은 물체를 만지작거리기 시작한다. 놀랍게도, 비둘기와 쥐는 키를 쪼거나 레버를 누르는 행위가 음식을 덜 얻게 되더라도(생략 훈련) 이러한 행동을 지속한다.[35][36] 강화 없이 나타나는 또 다른 외견상의 조작적 행동은 역설적 섭식(contrafreeloading)이다.

이러한 관찰 결과와 다른 결과들은 효과의 법칙과 모순되는 것으로 보이며, 일부 연구자들은 조작적 강화에 대한 새로운 개념화를 제안하게 했다. 보다 일반적인 견해는 자가 형성이 고전적 조건화의 한 예라는 것이다. 사실 자가 형성 절차는 고전적 조건화를 측정하는 가장 일반적인 방법 중 하나가 되었다. 이러한 관점에서 많은 행동은 고전적 우연성(자극-반응)과 조작적 우연성(반응-강화) 모두의 영향을 받을 수 있으며, 실험자의 과제는 이러한 상호 작용 방식을 파악하는 것이다.[40]

9. 응용 사례

B.F. 스키너가 정립한 응용행동분석은 조작적 조건화 원리를 사회적으로 중요한 인간 행동 수정에 적용하는 학문 분야이다.[24] 조건 자극, 차별 자극, 반응, 강화 자극(강화제의 경우 Srein 또는 Sr, 때로는 혐오 자극의 경우 Save)과 같은 조작적 조건화 이론의 기본 개념들이 활용된다.[78]

강화와 처벌은 인간의 사회적 상호작용에 널리 퍼져 있으며, 조작적 조건화 원리를 적용한 다양한 사례들이 제시되고 실행되어 왔다. 조작적 조건화의 일반적인 단계는 다음과 같다.


  • '''목표 설정''': 변화를 원하는 목표를 명확하게 설정한다. 예: "체중을 13.6kg 감량한다."
  • '''행동 관찰''': 원하는 결과가 나타나는지 지속적으로 확인한다. 예: 매일 체중을 그래프에 기록.
  • '''원하는 행동 강화''': 체중 감소를 칭찬하는 것과 같이 원하는 행동에 대해 보상한다. 행동 기록 자체가 강화제가 될수 있다. 예: 체중 감량 효과를 그래프로 확인하면 "감량 프로그램 지속"이라는 행동이 강화. '''토큰 경제'''로 일반화될 수 있는데, 원하는 행동에 대한 보상으로 토큰을 제공하고, 이를 나중에 원하는 상품, 보상, 명예 등과 교환하는 시스템.
  • '''바람직하지 않은 행동에 대한 유인 감소''': 예: 부엌에 간식이나 사탕을 두지 않음.


이러한 조작적 조건화의 원리는 다양한 분야에 응용된다.

  • '''응용 행동 분석 (ABA)''': 조기 집중 행동 개입(자폐 스펙트럼 장애 아동),[45] 범죄 행위 연구,[46] HIV 예방,[47] 천연 자원 보존,[47] 교육,[48] 노년학,[49] 건강 및 운동,[50] 산업 안전,[51] 언어 습득,[52] 쓰레기 무단 투기,[53] 의료 절차,[54] 양육,[55] 심리 치료, 안전벨트 착용,[56] 중증 정신 질환,[57] 스포츠,[58] 약물 남용, 공포증, 소아 영양 장애 및 동물원 관리 및 동물 관리[59] 등.
  • '''아동 행동 및 부모 관리 훈련''': 적절한 아동 행동에 대한 긍정적 강화를 제공. 칭찬, 미소, 포옹과 같은 사회적 보상과 스티커 또는 더 큰 보상을 위한 점수와 같은 구체적인 보상을 통해 적절한 행동에 보상.[60] 처음에는 간단한 행동을 선택하고 자녀가 더 큰 목표에 도달하기 위해 각 단계에 대해 보상하는 "점진적 근사" 방법.[60][61]
  • '''경제학''': 소비 수요 분석에 활용. 가격이 소비에 미치는 정도를 나타내는 "수요의 가격 탄력성" 개념이 대표적.[62] 상품의 가격 변화는 구매량에 큰 영향을 미칠 수 있지만, 휘발유와 같은 일상 소비재는 가격 변화의 영향을 덜 받을 수 있다. 조작적 조건화 분석의 관점에서 이러한 효과는 소비자의 동기와 강화물로서 상품의 상대적 가치의 관점에서 해석.[62]
  • '''도박''': 변동비율 일정은 예측할 수 없는 횟수의 반응이 나타난 후에 강화를 제공. 슬롯머신은 변동비율 일정에 따라 지급되며, 도박꾼들에게 지속적인 레버 당기기 행동을 유발. 슬롯머신 및 기타 도박 형태의 변동비율 지급은 도박 중독의 주요 원인.[63]
  • '''군사 심리학''': 제2차 세계 대전 이후, 미 육군은 조작적 조건화와 유사한 훈련 프로토콜을 도입. 3차원 인형 모양 팝업 표적을 사용한 사격 훈련, 현실적인 훈련, 반복 훈련, 상관의 칭찬, 사격술 보상, 집단 인정 등을 통해 긍정적 강화 제공. 부정적 강화에는 동료 책임이나 과정 재수강 요구 등이 포함. 현대 군사 훈련은 파블로프의 고전적 조건화와 B.F. 스키너의 조작적 조건화(행동주의의 형태)를 활용하여 실제 전투와 유사한 환경을 조성하고, 전투 압박에 대한 중뇌 반응을 조절.[64] 데이브 그로스만 중령은 현대 군사 사격술 훈련을 조작적 조건화의 거의 완벽한 적용이라고 평가.[66]
  • '''넛지 이론''': 강제가 아닌 간접적인 제안을 통해 집단 및 개인의 동기, 유인책 및 의사결정에 영향. 이는 직접적인 지시, 법률 또는 집행만큼, 아니면 그보다 더 효과적으로 준수를 달성.
  • '''칭찬''': B.F. 스키너의 조작적 조건화 모델에 기반을 둔 행동 강화 수단. 긍정적 강화의 수단으로, 특정 행동을 칭찬함으로써 그 행동이 발생할 가능성을 높임.[67] 교사와 부모가 칭찬을 사용하면 아동의 행동 개선과 학업 성취도가 향상,[68][74] 직무 성과도 향상.[69] 칭찬은 칭찬받지 않은 주변 사람(예: 칭찬받은 학생의 반 친구)에게도 대리 강화를 통해 긍정적 행동 강화.[70]
  • '''비디오 게임''': 강박 루프를 중심으로 설계되어 변동 비율 일정을 통해 긍정적 강화를 추가하여 플레이어가 계속 게임을 하도록 유도. 이는 비디오 게임 중독으로 이어질 수 있다.[75] 일부 게임에서는 전리품 상자를 보상으로 제공하는데, 이는 슬롯머신과 유사한 변동 비율 일정을 따르며, 도박과 유사하다는 논란.[76]
  • '''방어적 의료 행위''': 의료 소송 제한이 없는 주에서 진료하는 의사들은 부정적인 피드백(소송에 대한 두려움)에 반응하여 진료 방식을 변경하는 경향.[77]

9. 1. 중독과 의존

중독성 약물은 본질적으로 보상적이며, 약물 사용에 대한 일차적 양성 강화제 역할을 한다.[41][42][43] 뇌의 보상 체계는 약물에 유인 가치(즉, "원하는" 또는 "바라는")를 부여하며, 중독이 진행됨에 따라 약물 결핍은 갈망으로 이어진다. 약물 사용과 관련된 자극(예: 주사기의 모습, 사용 장소)은 약물에 의해 유발되는 강력한 강화와 연관된다.[41][42][43] 이러한 이전에는 중성적이었던 자극은 여러 가지 특성을 얻게 되는데, 예를 들어 자극의 출현은 갈망을 유발하고 지속적인 사용에 대한 조건화된 양성 강화제가 될 수 있다.[41][42][43] 따라서 중독된 개인이 이러한 약물 관련 단서 중 하나를 만나면, 관련 약물에 대한 갈망이 다시 나타날 수 있다. 일례로, 마약 단속 기관은 이전에 약물 관련 용품 이미지가 담긴 포스터를 사용하여 약물 사용의 위험성을 보여주려고 시도했으나, 이러한 포스터는 포스터에 묘사된 자극을 보았을 때 재발을 일으키는 유인 가치의 영향으로 인해 더 이상 사용되지 않는다.

약물 의존 개인에게서 음성 강화는 물리적 의존(예: 떨림, 발한) 및/또는 심리적 의존(예: 무쾌감, 불안, 과민성, 불안)의 증상을 완화하거나 "벗어나기" 위해 약물을 자가 투여할 때 발생한다.[41]

9. 2. 동물 훈련

동물 조련사와 애완동물 주인들은 조작적 조건 형성의 원리와 실제를 오래전부터 적용해 왔다. 동물 훈련은 조작적 조건화의 가장 명확하고 설득력 있는 사례 중 하나이다.[44]

동물 훈련에서 중요한 개념과 절차는 다음과 같다.

  • 일차 강화: 개 간식과 같이 동물이 기본적으로 원하는 것을 제공한다.
  • 이차 강화: 클리커 소리와 같이 원하는 반응 직후에 제시하고, 일차 강화물(간식)과 짝지어 제공한다.
  • 조건 형성: 강화(예: 클리커)가 원하는 행동에만 따르도록 한다.
  • 형성: 개가 점차 더 높이 점프하도록 훈련하는 것처럼, 원하는 행동을 점진적으로 만들어간다.
  • 간헐적 강화: 포만 상태를 유발하지 않고 지속적인 행동을 유도하기 위해 강화 빈도를 점차 줄인다.
  • 연쇄: 복잡한 행동을 더 작은 단위로 나누어 점진적으로 구성한다.[44]

9. 3. 응용 행동 분석 (ABA)

B. F. 스키너가 시작한 응용 행동 분석(Applied behavior analysis, ABA)은 조건화 원리를 사회적으로 중요한 인간 행동 수정에 적용하는 학문이다.[24] 조건 자극(SC), 차별 자극(Sd), 반응(R), 강화 자극(강화제의 경우 Srein 또는 Sr, 때로는 혐오 자극의 경우 Save)을 포함한 조건화 이론의 기본 개념을 사용한다.

응용 행동 분석(ABA) 실무자들은 이러한 절차와 그에 대한 많은 변형 및 발전을 다양한 사회적으로 중요한 행동과 문제에 적용한다. 많은 경우, 실무자들은 조작적 조건화 기법을 사용하여 비정상적인 행동을 대체할 건설적이고 사회적으로 용인되는 행동을 개발한다. ABA 기법은 조기 집중 행동 개입(자폐 스펙트럼 장애 아동을 위한),[45] 범죄 행위에 영향을 미치는 원리에 대한 연구,[46] HIV 예방,[47] 천연 자원 보존,[47] 교육,[48] 노년학,[49] 건강 및 운동,[50] 산업 안전,[51] 언어 습득,[52] 쓰레기 무단 투기,[53] 의료 절차,[54] 양육,[55] 심리 치료, 안전벨트 착용,[56] 중증 정신 질환,[57] 스포츠,[58] 약물 남용, 공포증, 소아 영양 장애 및 동물원 관리 및 동물 관리[59] 등에 효과적으로 적용되었다.

9. 4. 아동 행동 및 부모 관리 훈련

부모 관리 훈련은 적절한 아동 행동에 대한 긍정적 강화를 제공하는 데 중점을 둔다. 부모는 칭찬, 미소, 포옹과 같은 사회적 보상과 스티커 또는 더 큰 보상을 위한 점수와 같은 구체적인 보상을 통해 적절한 행동에 보상하는 방법을 배운다.[60] 또한, 부모는 처음에는 간단한 행동을 선택하고 자녀가 더 큰 목표에 도달하기 위해 각 단계에 대해 보상하는 "점진적 근사" 방법을 배운다.[60][61]

응용행동분석은 B.F. 스키너가 구축한 학문 분야로, 인간의 특정 사회적 행동을 수정하는 이론이다. 그 기저에는 조작적 조건화 이론이 있으며, 조건 자극(SC), 차별 자극(Sd), 반응(R), 강화 자극(Srein 또는 Sr), 혐오 자극(Save) 등의 용어가 사용된다.[78] 이 중 조건 자극은 감정 반응 등 고전적 조건화에 의해 형성된 행동을 통제한다.

응용행동분석은 다음과 같은 단계를 통해 이루어진다.

1. '''목표 제시''' : 어떤 변화를 원하는지 명확히 한다. (예: "체중을 13.6kg 감량한다.")

2. '''행동 관찰''' : 원하는 효과가 나타나는지 지속적으로 확인한다. (예: 매일 체중을 그래프에 기록한다.)

3. '''원하는 행동 강화''' : 체중 감소를 칭찬하는 것처럼, 원하는 행동에 대해 보상한다. 인간에게는 행동 기록 자체가 강화 역할을 할 수 있다. 감량 효과를 그래프로 확인하면, "감량 프로그램 지속"이라는 행동이 강화된다. 이를 일반화하면 '''토큰 경제'''가 되는데, 이는 원하는 행동에 대한 보상으로 토큰을 제공하고, 이를 나중에 원하는 상품, 보상, 명예, 상품이나 서비스와 교환하는 시스템이다.

4. '''바람직하지 않은 행동에 대한 유인 감소''' : 예를 들어, 부엌에 간식이나 사탕을 두지 않는 방식으로 바람직하지 않은 행동을 줄인다.

9. 5. 경제학

심리학자와 경제학자 모두 시장에서 인간의 행동에 조작적 조건화 개념과 연구 결과를 적용하는 데 관심을 갖게 되었다. 한 예로, 구매되는 상품의 양으로 측정되는 소비 수요 분석이 있다. 경제학에서 가격이 소비에 미치는 정도를 "수요의 가격 탄력성"이라고 한다.[62]

특정 상품은 다른 상품보다 탄력적이다. 예를 들어 특정 식품의 가격 변화는 구매량에 큰 영향을 미칠 수 있지만, 휘발유 및 기타 일상 소비재는 가격 변화의 영향을 덜 받을 수 있다. 조작적 조건화 분석의 관점에서 이러한 효과는 소비자의 동기와 강화물로서 상품의 상대적 가치의 관점에서 해석될 수 있다.[62]

9. 6. 도박

변동비율 일정(variable ratio schedule)은 예측할 수 없는 횟수의 반응이 나타난 후에 강화를 제공한다. 이러한 일정은 일반적으로 빠르고 지속적인 반응을 생성한다. 슬롯머신은 변동비율 일정에 따라 지급되며, 도박꾼들에게 이러한 지속적인 레버 당기기 행동을 유발한다. 슬롯머신 및 기타 도박 형태의 변동비율 지급은 종종 도박 중독의 근본 요인으로 언급된다.[63]

9. 7. 군사 심리학

인간은 기본적으로 살인에 대한 저항감을 가지고 있어서, 자신의 목숨을 지키기 위한 상황에서도 같은 종족에게 공격적인 행동을 하는 것을 꺼린다. 이러한 살인 저항성으로 인해 군사 전쟁 역사에서 보병의 효율성은 놀라울 정도로 낮았다.[64]

S.L.A. 마셜 준장이자 군사 역사가는 제2차 세계 대전 보병들을 전투 직후 면접 조사하여 이러한 현상을 연구했다. 마셜의 저서 「Men Against Fire」에 따르면, 전투에서 살인을 목적으로 소총을 발사한 병사는 15%에 불과했다.[65] 1946년 미 육군은 마셜의 연구 결과를 받아들여, 조작적 조건화 방법과 유사한 새로운 훈련 프로토콜을 도입했다. 이러한 훈련 방법은 한국 전쟁에서는 약 50%, 베트남 전쟁에서는 90% 이상으로 살상 능력을 가진 병사의 비율을 높였다.[64]

훈련 혁신의 예로는 3차원 인형 모양의 팝업 표적(피격 시 붕괴)을 사용한 사격 훈련장이 있다. 이는 즉각적인 피드백을 제공하고 병사의 행동에 대한 긍정적 강화 역할을 했다.[66] 이 외에도 시간제 사격 과정, 현실적인 훈련, 반복 훈련, 상관의 칭찬, 사격술 보상, 집단 인정 등이 긍정적 강화에 활용되었다. 부정적 강화에는 동료 책임이나 과정 재수강 요구 등이 포함되었다. 현대 군사 훈련은 파블로프의 고전적 조건화와 B.F. 스키너의 조작적 조건화(둘 다 행동주의의 형태)를 활용하여 실제 전투와 유사한 환경을 조성하고, 전투 압박에 대한 중뇌 반응을 조절한다.[64]

데이브 그로스만 중령은 조작적 조건화와 미군 훈련에 대해 다음과 같이 언급했다.

> 아마도 아무도 의도적으로 조작적 조건화 또는 행동 수정 기법을 사용하여 이 분야에서 병사들을 훈련시키려고 앉아 있지는 않았을 것이다…하지만 역사가이자 평생 군인인 심리학자의 관점에서 볼 때, 이것이 정확히 달성된 것이라는 사실이 점점 더 분명해졌다.[64]

현대 사격술 훈련은 행동주의의 좋은 예시이며, 웨스트포인트 미 육군사관학교에서는 모든 사관생도에게 가르치는 심리학 입문 과정에서 조작적 조건화의 고전적인 예시로 사용된다. 1980년대 웨스트포인트 방문 중 B.F. 스키너는 현대 군사 사격술 훈련을 조작적 조건화의 거의 완벽한 적용이라고 평가했다.[66]

9. 8. 넛지 이론

넛지는 행동 과학, 정치 이론 및 경제학에서 제시되는 개념으로, 강제가 아닌 간접적인 제안을 통해 집단 및 개인의 동기, 유인책 및 의사결정에 영향을 미칠 수 있다고 주장한다. 이는 직접적인 지시, 법률 또는 집행만큼, 아니면 그보다 더 효과적으로 준수를 달성할 수 있다는 것이다.

9. 9. 칭찬

칭찬은 B.F. 스키너의 조작적 조건화 모델에 기반을 둔 행동 강화 수단이다. 칭찬은 긍정적 강화의 수단으로, 특정 행동을 칭찬함으로써 그 행동이 발생할 가능성을 높인다.[67] 칭찬의 효과는 여러 연구에서 입증되었는데, 교사와 부모가 칭찬을 사용하면 아동의 행동 개선과 학업 성취도가 향상되고,[68][74] 직무 성과도 향상된다.[69] 칭찬은 칭찬받지 않은 주변 사람(예: 칭찬받은 학생의 반 친구)에게도 대리 강화를 통해 긍정적 행동을 강화한다.[70] 칭찬의 효과는 형태, 내용, 전달 방식에 따라 달라지며, 긍정적 행동 변화를 유도하려면 긍정적 행동에 따라 목표 행동의 특성을 명시하고 진심으로 전달해야 한다.[71]

칭찬은 긍정적 강화 전략으로서 행동 치료 및 인지 행동 치료에 통합되었다.[72][73] 칭찬의 전략적 사용은 교실 관리[72] 및 육아 훈련[74]에서 근거 기반 실천으로 인정받지만, 칭찬은 전략적 주의, 행동 보상 등 더 큰 범주의 긍정적 강화에 포함되기도 한다.

예를 들어, 체중 감량을 목표로 정하고 매일 체중을 그래프로 기록하여 체중 감소 여부를 확인한다. 체중 감소를 칭찬하면 행동 기록 자체가 강화제가 된다. 감량 효과를 그래프로 확인하면 "감량 프로그램 지속" 행동이 강화된다. 이는 원하는 행동에 대한 보상으로 토큰을 제공하고, 이를 나중에 상품, 보상, 명예 등과 교환하는 '''토큰 경제'''로 일반화할 수 있다.

9. 10. 비디오 게임

대부분의 비디오 게임은 강박 루프를 중심으로 설계되어 있으며, 변동 비율 일정을 통해 일종의 긍정적 강화를 추가하여 플레이어가 계속 게임을 하도록 유도한다. 이는 비디오 게임 중독이라는 병리 현상으로 이어질 수 있다.[75]

2010년대 비디오 게임의 수익화 추세에 따라, 일부 게임에서는 전리품 상자를 보상으로 제공하거나 실제 돈으로 구입할 수 있는 아이템으로 제공했다. 상자에는 게임 내 아이템이 무작위로 들어 있다. 이러한 관행은 슬롯머신 및 기타 도박 장치가 보상을 제공하는 방식과 동일하며, 변동 비율 일정을 따른다. 전리품 상자가 도박의 한 형태라는 일반적인 인식이 있지만, 이 관행은 소수의 국가에서만 그렇게 분류된다. 그러나 해당 아이템을 가상 화폐로 사용하여 온라인 도박을 하거나 실제 돈으로 거래하는 방법은 법적 평가를 받고 있는 스킨 도박 시장을 만들었다.[76]

9. 11. 조작적 조건형성과 방어적 의료 행위

방어적 의료 행위는 의료비용 급증의 여러 원인 중 하나로 제시된다. Prabhu는 Cole의 논문을 검토하면서, 두 그룹의 신경외과 의사들의 반응이 전형적인 조작적 조건화 행동임을 논의한다. 한 그룹은 의료 소송에 제한이 있는 주에서, 다른 그룹은 제한이 없는 주에서 진료를 한다. 신경외과 의사 그룹은 익명으로 진료 패턴에 대한 질문을 받았다. 의료 소송 제한이 없는 주에서 진료하는 그룹의 의사들은 부정적인 피드백(소송에 대한 두려움)에 반응하여 진료 방식을 변경했다.[77]

참조

[1] 서적 Animal Learning & Behavior Theory Earlbaum
[2] 학술지 Prior preferences beneficially influence social and non-social learning 2017-10-10
[3] 학술지 Animal intelligence: An experimental study of the associative processes in animals
[4] 서적 Behavioral Modification: Principles and Procedures Thomson/Wadsworth
[5] 서적 Parenting Wiley-Blackwell
[6] 서적 The Behavior of Organisms: An experimental Analysis https://openlibrary.[...] Appleton-Century-Crofts
[7] 학술지 Are theories of learning necessary?
[8] 서적 B. F. Skinner: The role of reinforcement and Punishment Worth, Incorporated
[9] 서적 Schedules of Reinforcement Appleton-Century-Crofts
[10] 학술지 Operant Conditioning 2003-02-01
[11] 서적 Radical Behaviorism: The philosophy and the science
[12] 서적 Science and Human Behavior MacMillan
[13] 서적 Walden Two Hackett
[14] 서적 Verbal Behavior Appleton-Century-Crofts
[15] 학술지 Operant variability: Evidence, functions, and theory
[16] 서적 Applied Behavior Analysis Pearson Education (US)
[17] 학술지 Neuronal reward and decision signals: from theories to data
[18] 서적 Science and Human Behavior http://www.bfskinner[...] The B.F. Skinner Foundation 2019-03-13
[19] 서적 Psychology 2nd ed.
[20] 서적 Behavioral Modification: Principles and Procedures Thomson/Wadsworth
[21] 서적 Behavioral Modification: Principles and Procedures Thomson/Wadsworth
[22] 학술지 Use of noncontingent reinforcement in the treatment of challenging behavior
[23] 학술지 Noncontingent reinforcement: an inappropriate description of time-based schedules that reduce behavior
[24] 서적 Behavior Analysis and Learning
[25] 학술지 Operant hoarding: A new paradigm for the study of self-control
[26] 학술지 Activity of pallidal neurons during movement http://jn.physiology[...]
[27] 서적 Electrophysiological studies of the function of the nucleus basalis in primates Plenum
[28] 학술지
[29] 학술지 Neuronal circuit mechanisms of competitive interaction between action-based and coincidence learning https://www.science.[...] 2024-12-06
[30] 학술지
[31] 학술지 By Carrot or by Stick: Cognitive Reinforcement Learning in Parkinsonism 2004-11-04
[32] 학술지 Predictive Reward Signal of Dopamine Neurons
[33] 학술지 Rats' responses to a moving object related to food or water: A behavior-systems analysis
[34] 학술지 Animals respond for food in the presence of free food
[35] 학술지 Auto-maintenance in the pigeon: sustained pecking despite contingent non-reinforcement
[36] 논문 Persistent approaches to a signal for food despite food omission for approaching.
[37] 논문 Feedforward vs feedbackward: An ethological alternative to the law of effect
[38] 서적 The structure of learning from sign stimuli to sign language Lawrence Erlbaum Associates
[39] 논문 Rethinking reinforcement: Allocation, induction and contingency
[40] 서적 Autoshaping and conditioning theory Academic Press
[41] 논문 Neuroscience for Addiction Medicine: From Prevention to Rehabilitation - Constructs and Drugs
[42] 논문 From prediction error to incentive salience: mesolimbic computation of reward motivation April 2012
[43] 논문 Pleasure systems in the brain May 2015
[44] 서적 Carrots and Sticks: Principles of Animal Training Sydney University Press
[45] 논문 None of the As in ABA stand for autism: dispelling the myths
[46] 논문 AIDS prevention: Improving nurses' compliance with glove wearing through performance feedback
[47] 논문 Office paper recycling: A function of container proximity
[48] 서적 Focus on behavior analysis in education: achievements, challenges, and opportunities Pearson/Merrill/Prentice Hall
[49] 논문 Independent use of activity materials by the elderly in a residential setting
[50] 논문 Effects of a variable-ratio reinforcement schedule with changing criteria on exercise in obese and nonobese boys
[51] 논문 The long-term effects of a token economy on safety performance in open-pit mining
[52] 논문 Effects of differential reinforcement on the generalization of a replacement mand in three children with severe language delays
[53] 논문 Positive reinforcement of litter removal in the natural environment
[54] 논문 Reinforcement of compliance with respiratory treatment in a child with cystic fibrosis
[55] 논문 Pyramidal training for families of children with problem behavior
[56] 논문 The effects of a seatbelt-gearshift delay prompt on the seatbelt use of motorists who do not regularly wear seatbelts
[57] 논문 Conversational skills training with schizophrenic inpatients: A study of generalization across settings and conversants
[58] 논문 Effects of public posting, goal setting, and oral feedback on the skills of female soccer players
[59] 논문 The role of applied behavior analysis in zoo management: Today and tomorrow
[60] 서적 Problem-solving skills training and parent management training for oppositional defiant disorder and conduct disorder Guilford Press
[61] 서적 Parent management training — Oregon model: An intervention for antisocial behavior in children and adolescents Guilford Press
[62] 서적 The Principles of Learning & Behavior Wadsworth Publishing Company
[63] 논문 Impulsivity, Intelligence, and Discriminating Reinforcement Contingencies in a Fixed-Ratio 3 Schedule 2012
[64] 서적 On Killing: the Psychological Cost of Learning to Kill in War and Society Little Brown
[65] 서적 Men Against Fire: the Problem of Battle Command in Future War Infantry Journal
[66] 웹사이트 Behavioral Psychology https://www.killolog[...] 2018-10-21
[67] 서적 History of behavior modification: Experimental foundations of contemporary research https://archive.org/[...] University Park Press
[68] 논문 Naturalistic assessment of children's compliance to teachers' requests and consequences for compliance 1983
[69] 논문 Task clarification, performance feedback, and social praise: Procedures for improving the customer service of bank tellers 1988
[70] 논문 The effect of vicarious reinforcement on attentive behavior in the classroom 1973
[71] 논문 On praising effectively 1981
[72] 논문 Evidence-based Practices in Classroom Management: Considerations for Research to Practice 2008
[73] 서적 Evidence-based psychotherapies for children and adolescents Guilford Press 2010
[74] 논문 Identifying Common Elements of Evidence-Based Psychosocial Treatments for Children's Disruptive Behavior Problems 2008-05
[75] 웹사이트 Behavioral Game Design http://www.gamasutra[...] 2001-04-27
[76] 웹사이트 Are loot boxes gambling? http://www.eurogamer[...] 2017-10-12
[77] 논문 Operant Conditioning and the Practice of Defensive Medicine 2016-07-01
[78] 서적 Behavior Analysis and Learning 2004
[79] 서적 내 생애의 첫 심리학 메이트북스 2021
[80] 웹사이트 조작적 조건화 이론 https://terms.naver.[...] 2013-02-25
[81] 서적 내 생애의 첫 심리학 메이트북스 2021
[82] 논문 정적강화와 부적강화가 고객 서비스 행동에 미치는 상대적 효과 https://www.dbpia.co[...] 2014
[83] 논문 자녀가 지각한 부모의 긍정적 강화가 비언어적 행동에 대한 민감성에 미치는 영향 http://www.riss.kr/l[...] 2006
[84] 논문 1999
[85] 논문 2002
[86] 논문 2001
[87] 논문 Temporal relationship between response and punishment https://doi.org/10.1[...] 1967
[88] 논문 Timeout punishment: Rate of reinforcement and delay of timeout https://doi.org/10.1[...] 2004-08-27
[89] 논문 ATTACK, AVOIDANCE, AND ESCAPE REACTIONS TO AVERSIVE SHOCK https://doi.org/10.1[...] 1967-03



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com